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PLATEFORME DE TYPE PRODUIT LOGICIEL POUR L' ANALYSE EN TEMPS REEL 
DE SITES INTERNET ET POUR CCMMENTER L T ANALYSE 

L" invention est relative a une plateforme de type 
produit logiciel pour l f analyse en temps reel de sites Internet 
et pour coramenter les resultats de l f analyse. 

Elle a pour but de fournir une telle plateforme qui 
5 puisse, de fagon rapide et automatique, produire des resultats 
d 1 analyse et des commentaires. 

La plateforme selon 1 T invention est caracterisee en ce 
qu'elle comprend : 

- des moyens d' analyse des donnees relatives aux 

10 visites de sites, 

- des moyens d 1 analyse de la visibilite du site dans 
1' ensemble du reseau Internet, 

- des moyens pour visualiser les donnees analysees, 

- une base de donnees dans laquelle sont stockees, 
15 selon des gabarits determines, des commentaires relatifs k des 

resultats d f analyse de donnees concernant les visites 
anterieures de sites et leur visibilite, ces ■ commentaires 6tant 
parametres en fonction de donnees d' analyses de visites et de 
visibilite, 

20 - des moyens pour, lorsqu'un nouveau site est analyse, 

extraire automatiquement de la base de donnee des commentaires 



I ci ucpui 

• # 



stockes ayant des parametres correspondants a ceux analyc^os pour 
ie nouveau site, et 

- des moyens pour stocker automatiquement des nouveaux 
commentaires. 

La description ci-apres explicite certains de ses 
modes de realisation et leurs avantages. 
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INTRODUCTION GENERALE 



Ce document est le cahier de specifications techniques du projet HoIosFind, II s'agit d'un 
extranet pour nes clients. lis ont acces, a travers cet plate-forme, aux etudes de 
positionnement, de trafic et de concurrents de leurs sites web. 

Nous allons commencer dans le premier chapitre par presenter I'architecture de 
HoIosFind ainsi que les differents modules qui le constituent. Le deuxieme chapitre 
s'interesse a 1'etat de I'art pour les differents choix techniques adoptes. Enfin, dans le 
troisieme chapitre, nous detaillons la partie Base de donnee en presentant le modele 
conceptuel de donnees et le modele physique de donnees. 
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CHAPITRE I 



ARCHITECHTURE DE HOLOSFIND 
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1. Introduction 

Dans ce chapitre, on va presenter d'abord les differents acteurs intervenants dans 
HolosFind, ensuite ('architecture generate detaillant les differents modules de 
HolosFind. 

1. Differents acteiars de H.OLOSFINB 

HOLOSFIND met en jeux quatre acteurs principaux, comme le montre la figure 1 : 

o Le consultant : est un acteur principal dans le processus de 
referencement. II a pour tache I'alimentation de la base de donnees par : 
les resultats de positionnement du client, les resultats de positionnement 
des concurrents, les commentaires et les informations sur le trafic d'outils 
de recherches. 

© L'administrateur a pour tache I'administration du site et de faire le suivi des 
consultants 

o Le client : est un acteur externe, il remplit un contrat dans lequel, il 
precise la nature de son secteur d'activite, I'ensemble d'outils de recherche 
dans iesquelles il desir reference son site. 

© Les ITPNs : sont des clients non potentiels qui ne possedent pas un contrat 
. avec referencement.com et qui desirent decouvrir les services offerts par 
cette derniere. 
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La figure suivante met en evidence les differents acteurs intervenant dans HOLOSFIND 



Le 



ITPN 



Le client 



IDENTIFICATION 



L'lTPN 




CONSULTA 



ADMINISTRATE 



Acteurs externes 



Acteurs internes 



2. Architecture generate de HOLOSFIND 

HolosFind se devise principalement en quatre sous sites : 

o Sous site client : Permet au client de visualiser I'avancement et le resultat 
de position nement fait par referencement.com, suivre son dossier en terme 
de consultation des caracteristiques de son site, avoir une idee sur le 
positionnement de ses concurrents, consulter les informations emises par 
son consultant et de suivre les acces a son site. 
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Sous site consultant : Permet au consultant d'alimenter la base de donnees 
par les informations relatives a I'etude de positionnement, suivie des 
. dossiers clients, aux concurrents et enfin au trafic outil de recherche. 



o Sous site administrateur : ce site permet a I'administrateur de superviser 
tout HolosFind, d'attribuer les mots de passe, de faire des mises a jours sur 
la base de donnees et d'affecter les clients aux differents consultants. 

o Sous site ITPN (Indice de Taux de Penetration sur le Net) : permet aux 
clients non potentiels de voir de pres rimportance de referencement a 
travers un demo. 
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CHAPITRE II 
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1. Introduction 

Dans ce chapitre, je vais mettre 1'accent sur les differents langages et outils utilises 
pour I'elaboration du projet et j'expliquerai leur choix en donnant un apergu sur les 
differentes solutions qui existent sur le marche et en mettant le point sur les avantages 
et les inconvenients de chacune de ces solutions. 

2. Etat de Part 

Dans cette partie, je vais proposer les solutions possibles pour le choix des 
differents outils necessaires pour le developpement du projet a savoir le langage 
Web, le SGBD, le serveur duplication et le serveur Web. 

2.1. Les langages Web 

2.1.1 Common Gateway Interface (CGI) 

Le Common Gateway Interface (CGI) a ete Tune des premieres technologies cote 
serveur pratiques pour creer dynamiquement des pages HTML. Les serveurs Web 
implementant CGI agissent comme une passerelle entre la requete de I'utilisateur et les 
donnees demandees. Pour ce faire, le serveur cree d'abord un nouveau processus dans le 
quel le programme s'execute. II charge ensuite I'environnement d'execution necessaire 
ainsi que le programme lui-meme. Enfin, il transmet un objet requete et invoque le 
programme. A la fin de celui-ci, le serveur Web lit la reponse depuis la sortie standard. 

L'inconvenient majeur de la programmation CGI est qu'elle n'est guere reactive. A 
chaque fols qu'une requete Web est r^gue par le serveur Web, un nouveau processus 
complet est cree (voir figure 7). La creation d'un processus pour chacune des requetes 
demande du temps et d'importantes ressources serveur, ce qui limite le nombre de 
requetes qu'un serveur peut traiter de fagon concurrente. 
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Serveur Web 



Common Gateway Interface 



Processus 1 



Processus 2 



Processus 3 



Environnement 



Environnement 



Environnement 



Variables 



Variables 



Variables 



Programme 



Programme 



Programme 



Figure 1 : Principe de fonctionnement des CGI 

2.1.2. Active Server Page (ASP) 

ASP (Active Server Pages) est un langage de script Microsoft permettant de 
developper des applications Serveur Web dynamiques et interactives. Cest un langage 
de script interprets du cote du serveur, et non du cote client comrne les scripts Java 
Scripts ou les Applets, qui eux s'executent dans le navigateur des visiteurs du site. 



Ainsi, les Active Server Pages s'inscrivent dans une architecture 3-tier, ce que 
signifie qu'un serveur supportant les Active Server Pages peut servir d'intermediaire 
entre le navigateur du client et une base de donnees en permettant un acces transparent 
a celle-ci grace a la technotogie ADO (ActiveX Data Object), qui fournit les elements 
necessaires a la connexion au systeme de gestion de bases de donnees et a la 
manipulation des donnees grace au langage SQL. (Figure 8). 
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Niveau 1 „ , Niveau 2 

Protocoles TCP/IP 



•6 % ■ 



,,,, 



Envohdes requetes 

^ H 



Envoi d'es reponses 




Client (navigateur ) 



Base de 
donnees 



Figure 2 : Processus de fonctionnement des ASP 



L'inconvenient fondamentai d'ASP est que cette technologie est proprietaire ; elle ne 
peut etre utiiisee qu'avec un serveur Web Microsoft (IIS, PWS) et avec un systeme 
d'exploitation Microsoft (Win9x, WinNT). II existe des portages vers d'autres plates- 
formes et serveur Web, mais leur prise en charge nuit a leur Interet. 



2.13. Personnel Home Pages (PHP) 

La troisieme technologie de creation et de gestion du contenu dynamique que je vais 
presenter est PHP (Personal Home Pages). PHP fonctionne de fagon similaire a ASP : les 
sections de script sont encadrees par des balises speciales et incorporees a une page 
HTML. Ces scripts sont executes sur !e serveur avant que la page ne soit envoyee au 
navigateur. 
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La figure suivante montre le principe de fonctionnement des PHP 



Niveau 1 



Protocol es 



Envoi des 



Envoi de 
^reponses' 



Client (navigateur ) 



Niveau 2 



Base de 
donnees 



Figure 3 : Processus de fopctionnement des PHP 



PHP utilise la syntaxe C et fournit un support efficace et simple pour le controle des 
types et I'acces a la base de donnees (voir figure 9). II est dote aussi d'extensions qui lui 
permettent de communiquer avec d'autres ressources comme la messagerie electronique 
et les annuaires. Contrairement a ASP, PHP est cependant independant de la plate-forme 
et existe pour les differentes versions de Windows, Unix et Linux, ainsi que pour de 
nombreux serveurs Web, dont Apache et IIS. Le facteur decisif est qu'il est libre et done 
« Open Source ». 

Bien qu'il possede de plus d'avantages par rapport aux langages qui precedent, ie 
PHP a desormais des inconvenients : il ne dispose pas de debuggeur qui permet de 
faciliter la recherche des erreurs lors de ('execution. De plus, PHP a des lacunes au 
niveau de la gestion des types de donnees. 



2.1,4. Java Server Pages (JSP) 

Les Java server Pages (JSP) sont la reponse de SUN a Microsoft. Les JSP sont des 
technologies cote serveur utilisant le langage oriente objet, Java. Les JSP fonctionnent au 
meme.titre que les CGI et les langages de script cote serveur tels que ASP ou bien PHP. 
lis permettent done de gerer des requetes et de fournir au client une requete HTTP 
dynamique. 

Les JSP ont de nombreux avantages par rapport aux autres technologies cote 
serveur. Tout d'abord, etant donne qu'il s'agit d'une technologie Java robuste et 
performante, les JSP fonctionnent sur n'importe quelle plate-forme, d'autant plus qu'ils 
sont independants du serveur Web. 
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Un autre principal atout des JSP est la reutilisation, qui permet de creer des 
composants encapsulant des services grace aux Java Beans et EJB (Entreprise Java 
Beans), afin de pouvoir les reutiliser dans des applications futures. (Voir figure ci- 
dessous) 




JSP page 



Browser 



Internet/intranet 





Beans 



Database 



V 



Web server with JSP engine 



Figure 4 : Principe des Java Beans 



Le code JSP s'execute dans un serveur d'application, appele aussi moteur de JSP. Le 
moteur JSP parcourt le code JSP et genere une servlet correspondante, sauf s'il en existe > 
deja une. IMnvoque ensuite la servlet et renvoie le contenu obtenu au navigateur Web 
(voir figure ci-dessous). Ainsi le programmeur n'a pas a se soucier de details techniques ' 
tels que la connexion au reseau, la mise en forme de la reponse a la norme HTTP, etc. » 

Enfin, les JSP peuvent utiliser toutes les API Java afin de communiquer avec des 
applications exterieures, de se connecter a des bases de donnees, d'acceder aux entrees- 
sorties, ... 
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Figure 5 : Processus de fonctionnement des JSP 



2.2. Les serveurs d s application 

Un serveur d'application est un serveur insere entre un serveur Web (sur lesquels 
sont connectes les clients) et le systeme d'information de I'entreprise. Ainsi, le serveur 
d'application genere dynamiquement des pages Web pour les utilisateurs connectes a 
partfr d'informations heterogenes, collectees dans les bases de I'entreprise. 

Le role du serveur d'application est de gerer I'ensemble des taches d'interconnexions 
du client tels que la repartition de charge entre plusieurs serveurs et la gestion des 
connexions aux bases de donnees. 

Les technologies les plus souvent utilisees par les serveurs d'application s'appuient 
sur « Enterprise Java Beans » . Enfin la grande force des serveurs d'application est de 
proposer un environnement de developpement afin d'automatiser et de generer des 
squelettes de code permettant d'implementer des objets predefinis. 

Parmi les serveurs duplications les plus repandus, nous trouvons JRun, Tomcat 
et Resin. 
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2.2.1. JRun 

JRun, edite par Allaire, est un serveur d'application Java compiet. II prend en charge 
les plus recentes normes de I'industrie pour le developpement d 'applications composees 
de servlets Java, JSP, Beans, Entreprise Java Beans ou de contenu statique, tels que des 
pages HTML et d'autres ressources. 

Sa conception ouverte lui a permis de fonctionner avec un grand nombre de serveurs 
Web existants, en particulier Apache, Microsoft Internet Information Server (ou IIS), 
Microsoft Personal Web Server (PWS) et Netscape. Avec JRun, on peut deployer des sites 
Web associes a un contenu genere dynamiquement sur presque toutes ies plates-formes 
(Windows 9x/NT/200, UNIX, Solaris et Linux) . 

2.2.2. Tomcat 

Tomcat est la solution de Sun. C'est un moteur JSP/Servlet, de la fondation Apache, 
utilise dans ('execution des Java Servlet et les technologies JSP. Tomcat tourne sur un 
nombre tres important de systemes d'exploitation differents, il est tres bien integre au 
serveur Apache (mais aussi a d'autres comme IIS) et il est disponible gratuitement; De 
ces caracteristiques decoule qu'il est tres simple de se documenter sur ce moteur de 
Servlets.. De plus, il n'est pas necessaire de demontrer Tefficacite du serveur Web 
Apache auquel on Tassocie en general. 

2.2.3. Resin 

Resin de Caucho possede un nombre important d'avantages : il supporte les 
principaux serveurs Web du marche (iPlanet, IIS, Apache) et dote d'outils interessants 
comme le support de XSL et XML pour gerer les modeles de documents et supporte 
meme la version 2.3 de TAPI des Servlets (qui n'est qu ! au stade de proposition) . 
Cependant Tutilisation est payante si elle entre dans un cadre commercial. 

23. Les serveurs Web 

Un serveur Web est un logiciel permettant a des clients d'acceder a des pages Web a 
partir d'un navigateur installe sur leur ordinateur distant. Un serveur Web est done un 
"simple ,, logiciel capable d'interpreter les requetes HTTP arrivant sur le port associe au 
protocole HTTP (par defaut le port 80), et de fournir une reponse avec ce meme 
protocole. Les principaux serveurs Web sur le marche sont PWS, IIS, Apache et 
Netscape Entreprise. 
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2.3.1. Personal Web Server (PWS) 

PWS est un serveur Web lie fortement a la technologie Microsoft. PWS peut etre 
employe sous Windows 95 ou Windows NT 4.0. Le logiciel PWS peut etre employe de 
deux manieres differentes. II peut servir a heberger un site a tres faible trafic (pour 
partager des documents sur I'Intranet d'une entreprise, par exemple) . II peut egalement 
servir a tester un site avant d'en transferer le contenu sur Internet Information Server. 
PWS ne permet pas de gerer qu'un nombre limite de connexions simultanees. 



2.3.2. Internet Information Server (IIS) 

IIS est un serveur Web centre sur la technologie Microsoft. Contrairement a PWS, 
IIS peut prendre en charge plusieurs connexions simultanees. Certains des plus grands 
sites Web d'Internet font appel a IIS. IIS ne peut pas etre utilise sous Windows 95 ou 98, 
mais seulement sous Windows NT Server ou Windows 2000 Server. II est inclus avec ces 
deux systemes d'exploitation. 



2.3.3. Netscape Entreprise 

Le serveur de Netscape Entreprise, pour UNIX et Windows NT, est tres avantageux 
pour les concepteurs d'Extranet parce qu'il permet les transmissions cryptees. II permet 
aux utilisateurs de servir differents serveurs Web en utilisant le meme serveur sur la 
meme machine. Le serveur de Netscape dispose egalement d'un systeme de certification 
relativement sur. II est fourni avec un outil de recherche et dispose de liens directs avec 
quelques protocoles de bases de donnees. Cependant, Netscape Entreprise ne fournira 
pas le code source pour le serveur, ce qui nous limite dans le choix de notre niveau de 
personnallsation. Ce serveur est, aujourd'hui I'un des plus chers sur le marche. 

2.3.4. Apache 

Apache est le fruit d'une multitude de correctifs logiciels afin d'en faire une solution 
tres sure. En effet Apache est considere comme ayant peu de failles connues. Ainsi des 
qu'un bug ou une faille de securite est decelee, ceux-ci sont rapidement corriges et une 
nouvelle version de I'application est editee. Apache possede desormais de nombreuses 
fonctionnalites dont la possibility de definir une configuration specifique a chaque fichier 
ou repertoire partage, ainsi que de definir des restrictions d'acces grace au fichiers 
httpd.conf. 
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Le fichier httpd.conf est un fichier de configuration d'Apache, permettant de definir 
des regies dans un repertoire et dans tous ses sous repertoires. On peut I'utiliser pour 
proteger un repertoire par mot de passe, pour changer le nom ou Pextension de la page 
index ou encore pour interdire Pacces au repertoire. 



Les environnements informatiques actuels dans les entreprises sont complexes et 
necessitent un Systeme de Gestion de Bases de Donnees Relationnelle (SGBDR) ouvert, 
tres performant et evolutif. Ce systeme doit etre capable de fonctionner sur differentes 
plates-formes, doit evoluer aisement en fonction des besoins, supporter les applications 
transactionnelles strategiques et etre dote d'interfaces ouvertes autorisant les 
integrations. 

Ce choix permet de depasser les inconvenients du systeme de fichier et de profiter 
par des avantages multiples : 

© Integrite : nous pouvons specifier des regies a respecter par les donnees. Un 
systeme de gestion de base de donnees (SGBD) peut controler la quantite de 
ses donnees plus avant et au-dela des moyens offerts par les programmes, 
duplications. 

© Securite : les donnees peuvent etre protegees contre les acces non autorises 
en lecture et ecriture. 

• Reprise sur panne : la base de donnees est protegee contre les fautes 
materielles, les pannes de disque et certains erreurs utilisateurs. 

* Partage entre applications : de multiples programmes d'application peuvent 
acceder et manipule des donnees dans la meme base. Une base de donnees 
est un media neutre qui facilite la communication entre des programmes 
isoles. 

o Extensibilite : des donnees peuvent etre ajoutees et reorganisees pour 

augmenter la rapidite. 
© Distribution des donnees : la base de donnees peut etre une partition nee sur 

des sites varies, sur diverses entreprises et diverses plates-formes 

materielles. 

© Le support des transactions est deja programme par les constructeurs. 
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2.4. Middlewares 

Le middleware est base sur des techniques de communication client-serveur, il 
assure les connexions entre les serveurs de donnees et les outils de developpement sur 
les postes clients. Cette couche de logiciels cache les reseaux et les mecanismes de 
communication associes. Elle assure une collaboration entre clients et serveur. 
Le middleware en terme d'archite c ture est defmi comme etant un ensemble de services 
logiciels construits au-dessus d'un p rotocole de transport afin de permettre Techange de 
requetes et des reponses associees e n tre le client et le serveur de maniere transparente. 11 
permet ainsi de masq uer l'heterogeneite des composants mis en ieu. 

o Transparence aux reseaux : tous les reseaux doivent etre supportes (LAN, WAN, 
etc.) le mediateur intervient au-dessus de la couche transport du modele OSI. 
Celle-ci pourra etre de type TCP/IP ou autres, elle pourra permettre 
I'etablissement de sessions et I'echange de messages au travers de la couche 
session ou bien par envoi de datagrammes isoles. 
o La transparence au serveur : le middleware doit etre capable de cacher la 
diversite des dialectes SQL souvent differents et d'uniformiser les langages en 
s'appuyant sur des standards. 
• La transparence aux langages : Le middleware doit permettre Integration des 
fonctions de connexions aux serveurs, d'emission et de reception des resultats 
dans n'importe quel langage de developpement utilise cote client. 
Les middlewares de donnees les plus connues sont : OLED3, ADO, ODBC et JDBC. 



2.4.1. Object Linking and Embedding Database (OLEDB) 

OLEDB est un ensemble d'interfaces qui accedent aux donnees avec n'importe quel 
type et a partir de plusieurs sources de donnees en utilisant le OLE Component Object 
Model (COM). En effet, OLEDB permet d'acceder aux donnees relationnelles et non 
relationnelles, par exemple, les fichiers XML, les documents Microsoft Office et les mails. 

OLEDB permet d'acceder aux donnees relationnelles ou hierarchiques, persistants ou 
volatiles, base sur SQL ou sur autre langage de requetes. Malgre les fonctionnalites 
qu'elle offre, la technologie OLEDB presente des defauts : 
» Technologie immature et instable ; 
a Non basee sur un standard ; 

o Technologie proprietaire de Microsoft et non disponible sur UNIX. 
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2.4.2. ActiveX Data Object (ADO) 

ADO est une extension de OLEDB et non une strategie d'acces differente. Elle peut 
acceder a un pilote ODBC a travers le pont (bridge) OLEDB-ODBC et simplifie beaucoup 
le developpement mais bien sur le probleme de portability sur des plates-formes non- 
WIN32 reste persistant. 

2.4.3. Open Data Base Connectivity (ODBC) 

ODBC est une couche logicielle devant permettre a une application d'acceder de 
fagon transparente a une base de donnees. L'utilisation d'une architecture ODBC s'avere 
pratique quand nous avons plusieurs SGBD differents et que nous voulons acceder d'une 
maniere uniformisee. En effet, la technologie ODBC permet d'interfacer de fagon 
standard une application a n'importe quel serveur de bases de donnees, pour peu que 
celui-ci possede un driver ODBC. 

ODBC c'est aussi le standard le plus supporte par les systemes d'exploitation pour 
I'acces aux donnees. II est base sur les specifications du SAG CLI et ANSI/92 SQL6. Les 



drivers cote client sont disponibles sur Windows, Unix et Macintosh et d'autres ' 
environnements. 



2.4.4. Java Database Connectivity (JDBC) 

JDBC est une API Java (ensemble de classes et d'interfaces definis par SUN et les 
acteurs du domaine des bases de donnees) permettant d'interagir avec des bases de 
donnees relationnelles a i'aide du langage Java via des requetes SQL. Cette API permet 
d'atteindre de maniere quasi-transparente des SGBD (MySQL, Sybase, Oracle, Informix, 
etc.). 

L'ensemble des classes qui implementent les interfaces specifiees par JDBC pour un 
gestionnaire de bases de donnees particulier est appele un pilote JDBC. Les protocoles 
d'acces aux bases de donnees etant proprietaires, il y a done plusieurs drivers pour 
atteindre diverses bases de donnees ( cf. figure 12 ). 

Ces drivers, classes en quatre types, peuvent etre ecrits entierement en Java et 
done etre telecharges, ou bien ils peuvent etre implementes en utilisant des methodes 
natives pour acceder aux librairies d'acces aux donnees existantes. 



6 SAG CLJ et ANSI/92 SQL sont deux normes qui spScifient la syntaxe d'ecriture des requites SQL. 
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Dans un systeme client-serveur, Pacces aux bases de donnees avec JDBC peut 
s'effectuer selon un modele a deux couches ou bien un modele a trois couches. 
JDBC offre plusieurs avantages : 

o API complet pour SQL dynamique ; 
o Nombreuses fonctions de conversions ; 
o Multiples pilotes : configurations 2-tiers, 3-tiers, etc. 
Cependant, JDBC presente des defauts : 

© Pas de verification de type vis a vis de la base de donnees ; 
o Les resultats ne sont pas des objets Java. 
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Figure 6 : Architecture de JDBC 



3. Les solutions adoptees 



3d. Choix du langage Web 

Pour choisir le langage approprie pour developper notre proiet, plusieurs criteres doivent etre 
pris en compte : 
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© La securite : la securite consiste a conserver les informations sensibles dans 

les mains des utilisateurs autorises. 
© La performance et la puissance : la performance et la puissance d'un langage 

dependent de son compilateur et de son cycle d'execution. 
© La portabilite : la portability d'un langage depend de la plate-forme qui le 

supporte. 

© La richesse des fonctionnalites : c'est le nombre de fonctions qu'un langage 
peut faire. 

© La simplicity de developpement : la facilite de developpement offert par un 
langage. 

© Le cout de support : le support est la plupart du temps gratuit. 
© La consommation memoire : c'est allouer de I'espace qu'il utilise lors de 
I'execution. 

« La reutilisation : c'est le fait qu'un programme realise puisse etre utilise par un - 
autre programme sans etre oblige de le programmer une autre fois (comme ] 
les applets Java). 4 
Le classement suivant a ete pris d'un article, ecrit par un specialiste de la programmation : 
Web : "Comparatifs des scripts cote serveur", que nous avons trouve sur Internet a - 
i'adresse suivante : www, denau. multimania. com . 



Criteres 


JSP 


PHP 


ASP 


CGI 


La securite (10) 


eleve 


bonne 


moyen 


faible 


La performance (5) 


eleve 


bonne 


moyen 


faible 


La portabilite (plates-formes et serveurs Web) 
(10) 


eleve 


bonne 


moyen 


fiable 


La richesse des fonctionnalites (5) 


eleve 


bonne 


moyen 


faible 


La simplicity de developpement (10) 


moyen 


eleve 


bonne 


faible 


Le cout de support le mois eleve (5) 


bonne 


Eleve 


faible 


moyen 


L'optimisation de la consommation memoire 
(10) 


bonne 


fiable 


moyen 


eleve 


La reutilisation (1) 


eleve 


* 


* 


* 



Tableau 1 : Classement des langages par critere 
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Legende : 

(*) Non specifie (1) requis 
indispensable 



(5) necessaire 



(10) 



Pour schematiser le classement des langages suivant les criteres, j'ai choisi d'attribuer 
les coefficients suivants : 



ICLASSERfiENTS 


COEFFICIENTS II 


Eleve 




Bonne 


0.5 


Moyen 


0.33 


Faible 


0.25 



Tableau 2 : Affectation des coefficients 



En faisant les sommes ponderees des coefficients des criteres de choix, nous obtenons le 
graphique suivant : 




Figure 7 ; Classification des langages 

A la lumiere des informations presentees dans I'etat de I'art et le classement par critere 
de choix trouve dans I'etude comparative, la technologie JSP s'avere la plus adequate. 
Dans ce qui suit, je justifierai le choix des differents outils lies a cette technologie. 
Choix du serveur d'application 
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Le choix d'un serveur depend essentiellement, en dehors des performances concernant ie 
service de contenu autre que des Servlets, de deux criteres : la version de 1'API Servlet 
et la version des JSP supportees. En effet, plus les versions de I 'API Servlet et les JSP 
supportees sont recentes, plus nous pourrons beneficier des fonctionnalites utiles. 

Ici, le systeme d'exploitation choisi n'entre pas en compte pour le choix du moteur de 
Servlets car, etant donne que ce type de serveur est (en general) programme 
entierement en Java, tout systeme d'exploitation disposant d'une implementation de la 
machine virtueile Java est censee fonctionner. Notre choix porte sur le serveur 
d 'application, JRun. Ce dernier constitue un choix interessant puisqu'il est aujourd'hui le 
plus repandu dans le monde professionnel. 

3.2. Choix du serveur Web 

Etant donne que nous avons choisi de coupler JRun a un serveur Web, nous devrons 
preter attention aux serveurs Web supportes. Les serveurs PWS et IIS ne constituent pas 
un bon choix puisqu'ils sont lies fortement a la technologie Microsoft. Parmi les serveurs . 
Web les plus repandus, le logiciel Apache est actuellement le serveur HTTP le plus utilise 
dans Internet. Dote de nombreuses fonctionnalites, performant et gratuit, Apache 
constitue alors un choix tres interessant pour notre application. 

3.3. Choix du SGBR 

MySQL est un Systeme de Gestion de Base de Donnees (SGBD) fonctionnant sous 
Windows et Linux. Ce systeme est une entite dans laquelle il est possible de stocker des 
donnees de fagon structuree et avec le moins de redondance possible. MySql permet 
d'assurer egalement des multiples connexions simultanees. 

Cependant, MySQL ne gere pas I'integrite des donnees et il n'assure pas done la 
sauvegarde et la restauration des donnees ce qui rend alors le traitement de donnees, 
d'une part, moins fiable et accelere, d'autre part, le traitement des donnees. 

Le choix de MySQL s'appuie principalement sur la rapidite des manipulations de donnees 
et sa tolerance a des multiples connexions simultanees. Nous pouvons dire alors que ce 
choix contribue pleinement a I'optimisation du site. 



3. 4. Choix du middleware 

Etant donne que nous avons choisi la technologie JSP, le middleware a utillser doit 
obligatoirement supporter le langage JAVA. Le mlddelware JDBC serait alors le plus 
adequat puisqu'il s'adapte bien avec la technologie JSP. 
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4. Conclusion 

Tout au long de ce chapitre, nous avons propose certaines solutions presentes et ensuite 
nous avons justifie les choix adoptes pour les outils de developpement qu'on va utiliser 
pour la realisation du projet. Dans le chapitre suivant, nous proposerons une conception 
du travail demande en tenant compte des ces differents outils choisis. 
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1. Introduction 

La mise en place d'un Extranet ne peut etre efficace que si celle ci est dlrigee du debut a 
la fin par une methode rationnelle et comprehensible par les differents acteurs qui 
interviennent tout au long de la vie du projet. 

Par la definition d'un certain nombre de regies strictes, la modelisation du systeme a 
Taide de la methodologie Merise garantit d'une part la coherence des donnees et 
traitements et done la validite d'une application et d'autre part la perennite des 
developpements realises grace une "maintenabilite" accrue. L'utilisation d'une telle 
methode est done primordiale pour tout developpement informatique actuel afin 
d'assurer la coherence entre le cahier des charges initial, issu de la volonte des dirigeants 
et I'application livree a I'utilisateur final. De plus, nous savons d'apres notre petite 
experience, que cette methode est la plus proche de la realite dans la modelisation des 
bases de donnees. 

La demarche utilisee dans Merise amene a representer plusieurs aspects du systeme 
etudie. En ce qui nous concerne, on va s'interesser uniquement a un aspect d'ordre 
conceptuel dans lequel on degagera le modele conceptuel et le modele physique des 
donnees. 

2. Modele Conceptuel de Donnees (MCD) 

Le Modele Conceptuel des Donnees (MCD), permet la description statique du systeme 
d'information a l'aide des concepts d'entite et d'association. II decrit la semantique e'est 
a dire le sens attache a ces donnees et a leurs rapports et non a l'utilisation qui peut en 
etre faite. 



©AMM-2002 



HOLOSFIND 



3. Modele Physique de ©oimees (MPB) 

Le Modele Physique des Donnees (MPD) permet une representation de la structure 
physique d'une base de donnees. C'est une image du modele conceptuel integrant les 
choix d'organisation des donnees (fichiers classiques, modele hierarchique ou modele 
relationnel). Dans notre cas, on utilise le modele relationnel. A partir du MCD, on a 
degage le MPD suivant : 
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1. Introduction 

Nous aliens presenter, dans ce qui suit, les differents acteurs intervenants dans 
HolosFind ainsi que I'architecture generale detaillant les differents modules de 
HolosFind. ^ 

1. Differents acteurs de HOLOSFIND 

HOLOSFIND met en jeux quatre acteurs principaux, comme le montre la figure 1 : 

« Le consultant : est un acteur principal dans le processus de 
referencement. II a pour tache Kalimentation de la base de donnees par : 
les resultats de positionnement du client, les resultats de positionnement 
des concurrents, les commentaires et les informations sur le trafic d'outils 
de recherches, 

© L'administrateur a pour tache ['administration du site et de faire le suivi des 
consultants 

« Le client: est un acteur externe, il remplit un contrat dans lequel, il 

precise la nature de son secteur d'activite, I'ensemble d'outils de recherche 

dans lesquelles il desir reference son site. 
• Les ITPNs : sont des clients non potentiels qui ne possedent pas un contrat 

avec referencement.com et qui desirent decouvrir les services offerts par 

cette derniere. 
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La figure suivante met en evidence les differents acteurs intervenant dans HOLOSFIND : 



Le client 



Le L'lTPN 




Acteurs externes Acteurs internes 



2. Architecture gemerale de HOLOSFINB 

HolosFind se devise principalement en quatre sous sites : 

o Sous site client : Permet au client de visualiser I'avancement et le resultat 
de positionnement fait par referencement.com, suivre son dossier en terme 
de consultation des caracteristiques de son site, avoir une idee sur le 
positionnement de ses concurrents, consulter les informations emises par 
son consultant et de suivre les acces a son site. 
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o Sous site consultant : Permet au consultant d'alimenter la base de donnees 
par les informations relatives a I'etude de positionnement, suivie des 
dossiers clients, aux concurrents et enfin au trafic outil de recherche. 



© Sous site administrateur : ce site permet a I'administrateur de superviser 
tout HolosFind, d'attribuer les mots de passe, de faire des mises a jours sur 
la base de donnees et d'affecter les clients aux differents consultants. 



• Sous site UPN (Indice de Taux de Penetration sur le Net) : permet aux 
clients non potentiels de voir de pres 1'importance de referencement a 
travers un demo. 



»:* 
■5 
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REVENDICATION 

1 . Platef orme de type produit logiciel pour l 1 analyse 
en temps reel de sites Internet comprenant : 
5 - des moyens d' analyse des donnees relatives aux 

visites de sites, 

- des moyens d 1 analyse de la visibilite du site dans 
l 1 ensemble du reseau Internet, 

- des moyens pour visualiser les donnees analysees, 

10 - une base de donnees dans laquelle sont stockees, 

selon des gabarits determines, des commentaires relatifs a des 
resultats d' analyse de donnees concernant les visites 
anterieures de sites et leur visibilite, ces commentaires etant 
parametres en fonction de donnees d x analyses de visites et de 

15 visibilite, 

- des moyens pour, lorsqu'un nouveau site est analyse, 
extraire automat iquement de la base de donnee des commentaires 
stockes ayant des parametres correspondants a ceux analyses pour 
le nouveau site, et 

20 - des moyens pour stocker automatiquement des nouveaux 

commentaires . 
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BEST AVAILABLE IMAGES 

Defective images within this document are accurate representations of the original 
documents submitted by the applicant. 

Defects in the images include but are not limited to the items checked: 

□ BLACK BORDERS 

□ IMAGE CUT OFF AT TOP, BOTTOM OR SIDES 

□ FADED TEXT OR DRAWING 
^□^BfcURRED OR ILLEGIBLE TEXT OR DRAWING 

□ SKEWED/SLANTED IMAGES 

□ COLOR OR BLACK AND WHITE PHOTOGRAPHS 

□ GRAY SCALE DOCUMENTS 

J^^LINES OR MARKS ON ORIGINAL DOCUMENT 

□ REFERENCE(S) OR EXHIBIT(S) SUBMITTED ARE POOR QUALITY 

□ OTHER: 

IMAGES ARE BEST AVAILABLE COPY. 
As rescanning these documents will not correct the image 
problems checked, please do not report these problems to 
the IFW Image Problem Mailbox. 



